This notebook contains some basic descriptive information about the first 200 active plaintiffs.

1. 获取所需数据

所有一审案件及其前200个活跃原告

活跃原告性别及年龄统计

2. 针对前两百活跃原告的统计信息

2.1 活跃原告案件数量,胜诉案,赢率, 惩罚金,标的,案由在时间地区的分布,法院法官频率,以及诉讼费的比例

案件数量,胜诉案数量-时间 画图

案件数量,胜诉案数量-省份 画图

胜率和时间省份的图

案件数量, 胜诉案,胜率-时间和省份 画图

案件数量-地理信息 画图

惩罚金-时间地区

标的-时间地区

诉讼费比例

案由-时间地区

法院-所有案件和胜诉案件的频率

法官-所有案件和胜诉案件的频率

2.6 经常被活跃原告告的被告有哪些,次数是多少,按照时间地区划分

2.7 是否存在某些活跃原告一直在起诉同一被告(看下前200个原告-被告的pair)

可以用neo4j做一下 TODO!!!

2.11 省份里活跃原告的分布和该省份赢率可能有关联

用分类问题的做法试一下 TODO!!!